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摘要 近年 来 ， 人 工 智 能 已 成 为 医疗 健康 相关 研究 的 重点 方向 和 国际 竞争 热点 。 为 了 解 我 国医 院 主导 人 工 知 
能 研究 的 现 况 及 挑战 ， 该 研究 采用 定量 、 定 性 相 结 合 的 研究 方法 ， 选 择 14 家 国家 高 质量 发 展 试 点 医院 作为 


样本 ， 对 样本 医院 2018 年 以 来 人 工 智 能 相关 研究 论文 及 专利 进行 分 析 ， 并 尝试 训 析 了 医院 主导 人 工 智 能 研究 
未 能 深入 开展 的 技术 性 挑战 。 结 果 显示 ， 医 院 主导 的 人 工 智 能 研究 论文 数 在 增加 ,但 约 55% 的 研究 仅 是 浅 层 
次 研究 ， 研 究 质 量 仍 可 提高 。 同 时 ， 医 院 获 批 的 人 工 智能 专利 数量 也 较 少 。 医 院 主导 人 工 智 能 研究 的 技术 性 
难题 在 于 学 习 曲 线 陡峭 、 和 迭代 计算 的 成 本 高 、 将 临床 多 模 态 数据 转化 为 高 质量 研究 数据 挑战 较 多 和 可 解释 性 
弱 。 医 疗 机 构 应 主动 响应 政策 推动 ， 调 动 内 部 资源 ， 提 前 布局 多 模 态 数据 资源 ， 培 养 人 工 智能 协调 员 ， 促 进 


研究 及 产 出 。 


关键 词 ”人工 智能 ， 医 院 主 导 ， 多 模 态 数据 ， 协 调 员 


近年 来 ， 人工 智 能 CAI) 正在 加 速 融 入 医疗 健康 
相关 研究 中 。 医 院 是 我 国医 疗 健康 领域 重要 的 人 工 
智能 研究 基地 与 产 出 基地 。 有 目前， 对 医院 主导 人 工 
智能 研究 现状 调查 尚 不 充分 。 部 分 关于 医院 人 工 智能 
的 研究 仅 强 调 了 外 部 资源 局 限 和 一 些 常见 的 伦理 问 
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题 。 一 些 定量 研究 虽 关 注 了 医疗 健康 人 工 智 能 研究 
状况 ， 并 通过 论文 数量 得 出 发 展 良好 的 结论 ， 但 其 分 
析 层 面 较为 宏观 ， 未 能 指出 发 展 中 不 均衡 、 不 充分 的 
部 分 站。 本 文 对 医院 主导 人 工 智 能 研究 的 现 况 进行 研 
R, 分 析 医 院 主导 人 工 智能 研究 需要 面 对 和 跨越 的 技 


资助 项 目 : 教育 部 人 文 社会 科学 重点 研究 基地 重大 项 目 (22JJD720007) 


修改 稿 收 到 日 期 : 2023 年 4 月 2 日 


Q 4 £75 院 刊 | 643 


ChinaXiv 合 作 期 刊 


| 科技 与 社会 


202305.00059v1 


chinaXiv 


术 性 难题 ， 并 针对 性 地 提出 管理 建议 。 


1 政策 推动 医院 开展 人 工 智能 研究 


我 国 高 度 重视 人 工 智 能 在 医学 中 的 研发 与 应 用 ， 
将 其 作为 新 一 轮 科技 革命 和 医疗 健康 产业 变革 的 核心 
驱动 力 ， 并 力图 在 新 一 轮 科 技 竞争 中 抢占 主导 权 。 
2017 年 ， 国 务 院 印发 《新 一 代 人 工 智能 发 展 规划 》 
( 国 发 (2017] 35 号 ) 提出 ， 要 发 展 便捷 高 效 的 智 
能 医疗 服务 ， 推 广 应 用 人 工 智 能 治疗 新 模式 新 手段 ， 
建立 快速 精准 的 智能 医疗 体系 ， 探 索 智 慧 医院 建设 。 
2021 年 ，《 国 务 院 办 公 厅 关于 推动 公立 医院 高 质量 发 
展 的 意见 》( 国 办 发 (2021) 18 号 ) 明确 ， 要 推动 手 
术 机 器 人 等 智能 医疗 设备 和 智能 辅助 诊疗 系统 的 研发 
与 应 用 。2022 年 ， 科 学 技术 部 等 六 部 门 印发 《关于 


关 数 据 需 要 耗费 大 量 的 人 力 物力 和 时 间 。 与 这 些 统计 
方法 相 比 ， 深 度 神经 网 络 、 机 天 学习 的 人 工 智能 研究 
范式 可 明显 扩展 纳入 研究 的 数据 模 态 ， 增 加 数据 量 ， 
并 加 速 信 息 采 集 过 程 。 与 此 同时 ， 医 院 是 医疗 健康 数 
据 的 重要 生产 基地 ; 医院 研究 者 更 加 贴近 患者 ， 更 容 
易 提 炼 出 具有 重大 科学 意义 的 医学 问题 及 技术 需求 。 
这 为 医院 主导 人 工 智能 研究 提供 了 重要 优势 。 当 前 ， 
我 国医 院 已 在 人 工 智能 研究 方向 发 力 ， 在 数据 挖掘 、 
图 像 识 别 、 上 自然 语言 分 析 及 机 器 人 辅助 等 4 项 通用 任 
务 框架 中 ， 解 决 疾病 诊断 、 治 疗 、 健 康 管理 和 医院 管 
理 等 方面 的 挑战 。 人 工 智能 技术 和 医院 的 数据 生产 将 
共同 赋 能 医院 研究 者 ， 不 断 完善 临床 诊疗 技术 、 构 建 
智能 医护 模式 、 优 化 健康 管理 体系 ， 产 出 传统 研究 方 
法 尚 无 法 解决 的 科学 问题 ， 从 而 孵化 出 满足 国家 战略 


加 快 场景 创新 以 人 工 智 能 高 水 平 应 用 促进 经 济 高 质量 
发 展 的 指导 意见 》 ( 国 科 发 规 [2022 ] 199 7.) , i 
一 步 指出 要 积极 探索 医疗 影像 智能 辅助 诊断 M D 
疗 辅助 决策 支持 、 医 用 机 器 人 、 互 联网 医院 、 智 能 
疗 设备 管理 、 智 慧 医 院 、 智 能 公共 卫生 服务 等 场景 。 
同年 ， 国 家 卫生 健康 委员 会 与 各 省 份 签订 的 《 共 建 高 
质量 发 展 试点 医院 合作 协议 》 中 明确 ， 要 夷 焦 数 字 
赋 能 ， 加 强大 数据 、 人 工 智 能 等 跨行 业 新 技术 应 用 ， 
建设 医疗 、 服 务 、 管 理 “ 三 位 一 体 ”的 智慧 医院 。 
“十 四 五 ”期 末 ， 试 点 医院 形成 中 国 智 慧 医 院 样板 ; 
“十 五 五 ”期 末 ， 面 向 世界 提供 智慧 医院 建设 中 国 解 
决 方案 。 

医院 采用 人 工 智 能 技术 开展 研究 ， 有 机 会 产 出 引 
领 性 、 凑 履 性 的 科技 进步 。 传 统 上 ， 医 院 主导 的 研究 
主要 使 用 经 典 的 数理 统计 来 区 别 有 效 信息 信号 ) 与 
无 效 信息 噪声 ) ， 其 技术 核心 是 包括 线性 回归 、 
Logistic 回归 、 决 策 树 等 在 内 的 一 系列 统计 分 析 方 法 ， 
纳入 的 数据 大 多 为 结构 化 的 定量 数据 。 采 集 和 整理 相 


S H 


网 


需求 和 人 民 健 康 需 要 的 重大 科技 进步 。 

人 工 智 能 临床 应 用 研究 已 成 为 国际 医学 研究 的 
重点 方向 和 竞争 热点 。 当 前 ,， 美国、 中 国 、 英 国 是 
在 医疗 健康 人 工 智 能 研究 中 贡献 论文 最 多 的 国家 。 
2020 年 ， 美 国 国立 卫生 研究 院 (NIH ) 启动 了 一 
项 总 金额 高 达 1.3 亿美 元 的 “ 通 往 人 工 智 能 之 桥 ” 
(Bridge2AI) 的 资助 计划 ， 旨 在 资助 生物 医药 等 相关 
领域 开展 人 工 智能 研究 。 国 际 一 流 医院 也 在 努力 布局 
人 工 智 能 的 研发 与 应 用 。2022 年 ， 美 国 《 新 闻 周刊 》 
( Newsweek) 和 德国 Statista 调查 公司 发 布 了 “世界 智 
能 化 程度 最 高 的 300 家 医院 ” 榜 单 。 该 榜 单 中 的 智能 
化 程度 以 “人 工 智能 ”“ 数 字 化 影像 ”“ 机 器 人 ”等 
维度 进行 评估 ; 排名 前 10 位 的 医院 中 ， 有 5 家 医院 被 
特别 地 标注 了 以 “人 工 智 能 ”为 代表 性 领域 ”。 


2 医院 人 工 智能 研究 数量 及 质量 分 析 


2.1 样本 医院 
2021 年 ， 国 家 卫生 健康 委员 会 面向 全 国 ， 选 定 了 


CD Newsweek Digital LLC, Statista Corp. World's Best Smart Hospitals 2023. (2022-09-16)[2023-02-28]. https://www.newsweek.com/rankings/ 


worlds-best-smart-hospitals-2023. 
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北京 协和 医院 、 北 京 大 学 第 三 医院 、 四 川 大 学 华西 医 
院 、 香 港大 学 深圳 医院 等 14 家 公立 医院 ， 作 为 国家 公 
立 医院 高 质量 发 展 试点 医院 。 这 14 家 医院 感受 到 的 政 
策 推 动 更 强 ， 因 而 具有 典型 性 。 同 时 ， 部 分 样本 医院 
具备 较 强 的 科学 技术 研究 能 力 ， 而 部 分 医院 在 科研 方 
面 能 力 较 弱 ; 通过 对 它们 主导 的 人 工 智能 研究 发 展现 
状 进行 调查 ， 有 助 于 了 解 我 国医 院 主导 人 工 智能 研究 
的 相关 情况 ， 具 有 一 定 程 度 的 代表 性 。 

2.2 研究 方法 

本 文采 用 定量 研究 方法 ， 对 发 表 论文 和 申请 专 
利 2 个 维度 开展 了 研究 。 

发 表 论 文 方面 ， 研 究 者 对 样本 医院 发 表 人 工 智能 
相关 论文 进行 了 统计 。 具 体 地 ，Q@ 从 维普 期 刊 平台 
fil PubMed 数据 库 2 分 别 检索 了 这 14 家 医院 以 中 文 和 
英文 发 表 在 期 刊 上 的 论文 ， 取 回 论文 标题 、 作 者 、 摘 
要 、 关 键 词 、 作 者 单位 等 信息 。@ 采用 关键 词法 在 前 
述 论文 中 识别 人 工 智能 相关 论文 。 如 果 论 文 的 标题 、 
摘要 、 关 键 词 中 提 及 了 “人 工 智能 
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度 进行 了 统计 和 分 析 。 

专利 申请 方面 ， 人 研究 者 从 国家 知识 产权 局 网 站 
“专利 检索 及 分 析 ” 系 统 检索 了 相同 时 间 段 内 获 批 
的 、 包 含 “ 人 工 智 能 ”关键 词 的 相关 发 明 、 实 用 新 型 
专利 项 目 ， 并 对 其 数量 进行 统计 。 
2.3 发 表 论 文 分 析 

(1) 论文 数量 。 样 本 医院 在 2018 年 一 2019 年 、 
2021 年 一 2022 年 共 发 表 中 文 和 英文 论文 13.34 万 
篇 ; 其 中 ， 人 工 智能 相关 研究 论文 3 002 篇 ， 占 比 
较 低 ， 仅 为 2.25%。 样 本 医院 参与 人 工 智能 研究 论 
文 数 从 2018 年 的 222 篇 逐年 增长 至 2022 年 1434 篇 
(图 1) , 但 2022 年 的 同比 增 速 (53.70% ) 远 低 
于 2019 年 的 同比 增 速 (86.04% ) 。 结 果 提 示 ， 医 院 参 
与 人 工 智能 研究 可 能 遇 到 了 一 系列 挑战 ， 发 展 可 能 进 
入 瓶颈 期 。 

(2) 发 表 语言 。 以 中 文 作为 发 表 语言 的 论文 数 占 
比 从 35.59% 逐年 下 降 至 15.34%， 且 各 年 占 比 均 低 于 
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31000 " 
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( convolutional neural network, $9 goo A 
CNN)" ”“ 残 差 网 络 (residual 600 iis 
network ) ”等 人 工 智能 的 标志 性 中 400 
文 或 英文 关键 词 ， 则 将 其 标记 为 人 200 = -" pem 
i 6 MA 2 人 bM 
工 智 能 相关 论文 。 纳 入 研究 的 论文 cm TE epe zum up db 
发 表 时 间 为 2018 年 一 2022 年 ; 其 ma 第 一 作者 单位 为 样本 医院 的 Al 论文 数 
Ij » » EA E 第 一 作者 属于 其 他 单位 的 Al 论文 数 
中 ， 因 受 新 冠 肺炎 疫情 影响 较 大 ， 一 本 一 Al 论文 在 总 发 表 论文 中 数量 占 比 


2020 年 暂 不 纳入 调查 。@) 对 论文 图 1 
的 数量 、 发 表 语 言 、 研 究 层次 等 维 Lee] 


hospitals 


14 家 样本 医院 发 表 人 工 智能 相关 研究 论文 总 数量 及 在 总 发 表 论文 数 中 的 占 比 
Volume of AI related research papers and its proportion in all papers by pilot 


© 美国 国立 生物 技术 中 心 (NCBI) 开发 的 网 上 免费 检索 生物 医学 文献 的 检索 系统 。 
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全 部 领域 论文 中 中 文 语言 占 比 (图 2 ) 。 结 果 提 示 ， 60.00 

医院 的 人 工 智 能 研究 更 倾向 于 发 表 在 国际 期 刊 上 。 51.98 
G) 第 一 作者 。 本 文 以 第 一 作者 单位 是 样本 医院 。 

的 论文 数量 作为 衡量 医院 主导 人 工 智能 研究 的 指标 。 3.8 

样本 医院 主导 发 表 了 1 728 篇 人 工 智能 研究 论文 , 占 S 

参与 人 工 智能 研究 数 的 57.56%。 这 说 明 ， 相 当 多 的 X 3000 

研究 并 非 由 医疗 机 构 主导 。 主 导 人 工 智能 研究 最 多 A 


是 A 医 院 ，2022 年 已 达 255 篇 ， 约 占 样本 医院 主导 人 ® 
工 智能 研究 发 表 论文 数 的 1/3; 同时 ，A 医院 的 研究 10.00 
基数 也 较 大 (728653) 。 主 导 人 工 智 能 研究 数量 排 


第 2 位 的 B 医院 的 研究 基数 也 较 大 ， 人 情况 与 A 医 院 相 2018 2019 2021 2022 (年 ) 
> 似 ED 。 结 果 提 示 ， 医 院 主导 人 工 智 能 研究 的 发 加 医学 领域 中 文 论文 占 比 〈%) mmm A 领域 中 文 论文 占 比 (96) 
[D — AGOSERAUEUUT BUGEUROUERGAR. a ee 
© (DARAK BHERSSRISBATHNU  Derl rore an 全 
" 
e 表 1 ， 样本 医院 主导 人 工 智能 研究 发 表 论文 数 及 在 总 发 表 数 中 的 占 比 
eo Table 1 Hospital-led AI research papers in pilot hospitals and its propotions in total papers 
e N 20184 20194 20214 20224 小 计 
N ind 论文 (篇 ) 占 比 (96 论文 (篇 ) 占 比 (O0 论文 (篇 ) 占 比 (99 论文 (篇 ) 占 比 (9) 论文 (篇 ) 占 比 (99 
去 A 医 院 26 0.67 59 1.40 179 2.95 255 3.50 519 2.42 
a B 医 院 24 0.89 30 1.06 91 2.73 137 4.41 282 2.53 
E C 医 院 YY 0.38 25 1.23 55 1:91 83 2.84 170 1.75 
ET D 医 院 11 0.47 27 1.06 40 1.90 60 2.69 138 1.49 
EE x 6 0.52 mJ 0.52 37 2 OI 55 3.51 105 1.70 
F 医 院 6 0.68 16 1.74 35 3.05 54 4.59 111 1.97 
G 医 院 5 0.37 17 1.25 42 2.33 52 3.08 116 2.81 
H 医 院 21 0.96 24 0.91 9 1.52 25 3.23 79 1.95 
| 医院 6 0.65 10 3l] 22 1:99 23 2.06 61 0.99 
J 医 院 2 0.41 8 1.68 14 2.92 17 3.46 41 0.98 
K 医 院 1 0.09 3 0.25 12 1.07 16 2.16 32 1.09 
LE 5 0.65 T 0.91 12 1.62 16 2.47 40 2.06 
M 医 院 1 0.22 6 1.14 8 1.84 8 1.67 23 I2 
N 医 院 0 0.00 1 0.98 3 1.83 7 3.74 11 1.92 
合计 121 0.42 240 0.76 559 IES 808 2.15 1728 1.80 
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究 数 量 在 提高 ， 遗 情 的 是 ， 医 院 主导 人 工 管 能 研究 质量 仍 
可 提高 。 约 55% 的 研究 (67.29% 的 中 文 论文 和 45.92% 的 
英文 论文 ) 仅 以 “人 工 智能 ”或 “深度 学 习 ” 或 “机 器 学 
习 ” 作 为 关键 词 ， 这 些 论 文大 多 尚 停留 展望 、 讨 论 人 工 智 
能 可 能 应 用 于 某 领域 的 较 浅 的 研究 层次 上 。 基 于 支持 向 量 
机 (SVM ) 的 前 一 代 人 工 智能 研究 范式 仍 占 样本 医院 主 
导 人 工 智能 研究 的 相当 比例 (图 3 ) 。 


其 他 关键 词 ，4.72% 
无 监督 学 习 ，0.84% 
先 验 算法 (AprioriAlgorithm) , 0.84% 
卷 积 神经 网 络 (CNN) ，0.84% 
工 神 经 网 络 (ANN) ,1.30% 

然 语言 处 理 ，1.39% 

邻近 算法 (KNN) ，1.67% 

随机 森林 (Random Forest) ，3.25% 


支持 向 量 机 (SVM) , 8.5596 
神经 网 络 ，9.29% 
机 器 学 习 ，10.69% 
人 工 智能 ，41.54% 
深度 学 习 ，15.06% 


machine learning, 21.8% 
其 他 关键 词 , 4.596 
ificial neural network, 1.35% 
resnet, 1.48% 
k nearest neighbor, 2.4996 
unsupervised learning, 3.7496 
neural networks, 4.0696 


supervised learning, 5.5696 


convolutional neural network (CNN), 6.6296 
random forest, 8.1796 
artificial intelligence, 8.8196 
support vector machine (SVM), 16. 
deep learning, 15.3196 


E 3 样本 医院 发 表 中 文 (a) 和 英文 (b) 论文 的 人 工 智 能 
关键 词 占 比 

Figure3 Proportion of AI key words in Chinese (a) and English 
(b) papers by pilot hospitals 
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2.4 人 工 智能 相关 专利 

2021 年 以 来 ， 多 家 试点 医院 人 工 智能 专利 授权 数 
实现 了 “ 零 ”的 突破 ， 总 量 也 从 2018—2019 年 的 2 件 
提高 到 了 2021—2022 年 的 46 件 (3€ 2) 。 其 中 , DE 
院 2021 年 实现 了 11 件 授权 的 高 峰 。 然 而 ， 人 工 智 能 研 
究 转 化 专利 数量 较 少 且 不 稳定 ， 并 未 形成 稳定 的 人 工 
智能 研究 计划 及 产 出 。 


3 医院 主导 深度 人 工 智能 应 用 研究 的 挑战 
分 析 


医院 研究 者 主导 人 工 智能 研究 的 优势 是 更 加 接近 
临床 需求 ， 更 加 接近 来 自 患 者 的 多 模 态 医疗 健康 数 
据 ， 因 而 更 有 希望 产 出 深度 的 、 具 有 应 用 意义 的 人 工 
智能 研究 成 果 。 本 研究 发 现 ， 医 院 参 与 和 主导 的 人 工 
智能 研究 数量 正在 逐年 增加 ， 医 院 研究 者 对 人 工 智 能 

R2 样本 医院 人 工 智能 相关 授权 专利 数 (单位 : 件 ) 


Table2 Authorized AI related patents of pilot hospitals (Units: 
patents) 


样本 医院 ”2018 年 2019 年 2021 年 2022 年 
A 医院 0 0 0 0 
B 医 院 0 1 2 5 
C 医 院 0 0 0 1 
D 医院 1 0 11 2 
E 医 院 0 0 2 1 
F 医 院 0 0 2 0 
G 医 院 0 0 2 2 
H 医院 0 0 3 3 
1 医院 0 0 4 0 
J 医院 0 0 4 1 
K 医 院 0 0 0 0 
L 医 院 0 0 0 1 
M 医院 0 0 0 0 
N 医 院 0 0 0 0 
hr 1 1 30 16 
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研究 范式 的 热情 越 来 越 高 涨 ， 投 入 也 越 来 越 多 。 结 合 
前 文 定量 分 析 结 果 ， 本 文通 过 深度 访谈 、 专 家 咨询 等 
方法 ， 从 学 习 应 用 、 研 究 成 本 和 研究 的 组 织 管理 3 个 
层面 ,剖析 医 院 主导 深度 人 工 智能 应 用 研究 存在 的 技 
术 性 挑战 与 困境 。 
3.1 学 习 曲 线 陡峭 

(1) 系统 学 习 深 度 神 经 网 络 范式 。 深 度 神 经 网 
络 范式 由 一 系列 相互 关联 的 技术 路 线 和 细节 构成 ， 
知识 容量 较 大 。 例 如 ， 常 见 的 人 工 智 能 模型 有 卷 积 神 
经 网 络 (CNN) 、 循 环 神经 网 络 (RNN ) 、 转 换 顺 
(transformer ) 、 生 成 式 对 抗 网 络 (GAN ) 等 。 在 最 
基础 的 CNN 模型 中 ， 研 究 者 需要 学 习 感 知 器 、 多 层 神 
经 网 络 、 卷 积 核 、 梯 度 下 降 、 损 失 函 数 、 正 则 化 等 一 
系列 知识 点 。 虽 然 医 院 的 研究 者 大 多 接受 过 传统 数理 
统计 分 析 技 术 的 训练 ， 但 很 少 有 人 接受 过 人 工 智 能 技 
术 的 系统 训练 。 医 院 的 研究 者 完成 深度 神经 网 络 范 式 
的 系统 性 学 习 ， 往 往 只 能 利用 工作 之 外 的 业余 时 间 自 
学 或 参加 相关 培训 班 。 

(2) 学 习 程 序 编写 。 O 编程 环境 配置 的 挑战 。 
人 工 智 能 的 主流 语言 是 Python ， 但 程序 实现 还 需要 
依靠 专门 的 中 层 框架 。 中 层 框 架 有 多 种 选择 ， 包 括 
谷歌 ( Google ) 公司 主导 开发 的 Tensorflow， 脸 书 
( Facebook ) 公司 主导 开发 的 Pytorch， 以 及 百度 公司 
主导 开源 的 飞 浆 ( PaddlePaddle ) 等 。 每 一 种 中 层 框 
架 都 处 在 快速 的 更 迭 之 中 ， 前 一 代 的 功能 可 能 在 后 一 
代 版 本 中 被 直接 取消 。 对 于 初学 者 而 言 ， 需 要 花费 很 
长 的 时 间 ， 才 可 能 准确 地 在 人 工 智能 社区 找到 与 本 地 
环境 相对 应 的 解决 方案 。 而 一 些 使 用 者 较 少 的 中 层 框 
架 ， 辅 助 学 习 资源 则 更 少 。@ 编程 和 排除 编程 错误 
的 挑战 。 医 院 的 研究 者 使 用 的 数理 统计 软件 ， 大 多 可 
以 通过 鼠标 点 选 不 同 模块 下 的 按钮 实现 ， 且 这 些 软件 
常常 配备 详尽 的 使 用 说 明 。 人 工 智能 研究 则 需要 研究 
者 从 “ 零 ”撰写 程序 ， 包 括 导 人 中 层 框 架 、 加 载 必要 
基础 模块 等 。 研 究 者 排除 程序 错误 通常 会 花费 比 编写 


Im 


程序 更 多 的 时 间 。 对 初学 者 而 言 ， 遇 到 的 绝 大 多 数 问 
题 都 需要 向 外 部 寻求 解决 方案 。 当 辅助 学 习 资 源 较 少 
时 ， 会 对 积极 性 造成 致命 的 打击 。(@@) 多 模 态 数据 挑 
战 。 在 传统 的 数理 统计 研究 中 ， 进 入 统计 模型 的 大 多 
是 结构 化 的 、 以 数值 为 形式 的 数据 。 但 在 人 工 智能 研 
究 中 ， 数 据 扩展 至 单一 图 像 (如 义 线 平 片 ) WAR 
像 (如 CT、 核 磁 ) 、 连 续 图 像 ( 如 超声 录像 、 内 镜 录 
像 ) 、 文 本 ( 如 病历 、 诊 断 报告 等 ) 等 多 模 态 数据 。 
研究 者 不 得 不 学 习 将 这 些 数据 导出 、 输 入 到 人 工 智能 
程序 中 需要 的 编程 技能 。 

(3) 计算 机 相关 英语 语言 能 力 。 当 前 ， 高 质量 
的 人 工 智能 入 门 书籍 都 以 英文 书写 。 虽 然 部 分 经 
作 有 中 文 译本 ， 但 由 于 翻译 、 出 版 存在 周期 ， 这 
作 中 援引 的 学 习 资 源 甚至 中 层 框架 都 发 生 了 变化 。 对 
于 初学 者 而 言 ， 即 使 是 一 步 步 地 照 着 做 ， 可 能 也 达 不 
到 预期 的 目的 。 相 似 的 ， 多 数 高 质量 的 人 工 智能 技术 
讨论 社区 也 是 用 英文 作为 主要 语言 。 高 水 平 医院 的 研 
究 者 的 英文 水 平 较 高 ， 但 仍 需 迈 过 阅读 和 理解 计算 机 
领域 研究 的 关口 。 这 也 从 侧面 印证 了 前 文 的 发 现 ， 即 
越 来 越 多 的 人 工 智能 研究 成 果 以 英语 发 表 在 国际 期 刊 
Es 
3.2 迭代 计算 产生 时 间 和 硬件 成 本 

医院 主导 人 工 智 能 研究 的 迭代 成 本 较 高 ， 而 适 
代 成 本 主要 可 以 分 为 时 间 成 本 和 硬件 成 本 2 类 ， 且 
这 2 类 成 本 在 一 定 程度 上 可 以 相互 转化 。 

(1) 人 工 智 能 技术 的 选 代 特性 导致 时 间 成 本 较 
高 。 机 器 学 习 算 法 通过 自动 迭代 计算 来 获得 神经 网 络 
模型 的 最 优 参 数 解 ， 使 用 成 本 较 低 、 普 及 度 较 高 的 中 
央 处 理 器 (CPU ) 计算 需要 耗费 较 长 的 时 间 。 在 深度 
学 习 的 经 由 人 门 任务 MINIST 数据 集 ( 手写 数字 数据 
集 ) 中 ， 图 像 大 小 为 28 像素 x 28 像素 ，CPU 可 以 在 
分 钟 级 别 的 时 间 内 完成 多 次 迭代 ， 获 得 最 优 解 。 但 随 
着 模型 导数、 迭代 次 数 及 图 像 大 小 的 增加 ， 时 间 成 本 
将 迅速 提高 。 例 如 ， 在 图 像 大 小 为 224 像素 x 224 f 
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素 大 小 的 ResNet-50 网 络 模型 (49 层 ) 中 ， 如 果 使 用 
一 颗 高 级 别 的 CPU 迭代 计算 90 次 ， 则 需要 约 700 小 
时 才能 完成 。 在 临床 研究 的 实际 问题 中 ， 使 用 成 本 较 
低 的 CPU 计算 人 工 智能 的 时 间 成 本 将 超过 研究 者 可 接 
受 的 极限 。 一 方面 ， 常 规 的 X 线 、CT 和 核磁 的 单 幅 
图 像 横向 或 纵向 分 辩 率 都 在 1 000 像素 以 上 ; 另 一 方 
面 ， 具 有 实际 应 用 意义 的 神经 网 络 模型 也 在 10 至 数 
十 层 之 间 。 

(2) 医院 主导 人 工 智能 研究 需 投 入 相当 高 的 
硬件 成 本 。 相 比 CPU， 使 用 价格 更 高 的 图 形 处 理 需 
(GPU) , ， 可 以 大 幅 减 少 计算 需要 付出 的 时 间 成 本 。 
理论 上 ， 使 用 专业 GPU 完成 前 文 ResNet-50 的 计算 任 
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匹配 的 计算 硬件 资源 是 一 项 难度 相当 大 的 挑战 。 
3.3 将 临床 数据 转化 为 高 质量 研究 数据 
将 临床 采集 的 数据 转化 为 高 质量 的 研究 数据 是 人 
工 智能 研究 的 必要 条 件 ， 但 是 尚 需 面 对 以 下 挑战 。 
(1) 临床 生产 的 数据 同 质 化 水 平 不 高 中 。 以 图 像 
为 例 ， 在 质量 同 质 化 较 低 的 医院 中 ， 生 产 图 像 的 平台 
科室 只 需 确 保 图像 中 包含 有 助 于 医师 诊断 疾病 的 部 分 
即 可 ， 对 局 部 出 现在 图 像 画 幅 上 的 位 置 、 对 比 度 等 要 
求 不 高 。 在 人 工 智 能 技术 中 ， 图 像 将 被 自动 化 地 转化 
为 由 代表 每 一 个 像素 的 数值 、 向 量 或 张 量 ， 然 后 投入 
人 工 智能 模型 。 此 时 ， 图 像 的 背景 、 亮 度 、 色 温 ， 疙 
至 研究 兴趣 区 在 画幅 中 的 位 置 、 大 小 、 角 度 等 因素 都 


务 比 使 用 服务 器 级 别 的 CPU 快 近 40 倍 。 由 于 多 数 医 
学 图 像 的 辨析 度 较 高 、 图 层 数 较 多 ， 医 院 主导 人 工 智 
能 研究 几乎 难以 避免 地 需要 添置 GPU ， 有 时 还 需要 添 
置 与 之 匹配 的 专门 的 计算 平台 。 例 如 ， 美国 麻 省 理工 
总 医院 ( Massachusetts General Hospital ) 在 基于 本 院 
的 影像 数据 开发 人 工 智能 图 像 处 理 程序 的 任务 中 ， 专 
门 引 入 了 一 台 配 备 了 8 部 GPU (vioo 型号) 、 单 价 高 
达 12.9 万 美元 的 英 伟 达 (NVIDIA ) DGX 平台?。 相 
似 的 ， 在 美国 梅 奥 诊所 (Mayo Clinic ) 主导 的 一 项 基 
于 核磁 图 像 的 GAN 研究 中 ， 也 使 用 了 DGX 系列 计算 
平台 外 。 目 前 ， 有 实用 价值 的 人 工 智 能 技术 的 参数 量 
越 来 越 大 ， 对 硬件 的 要 求 也 越 来 越 高 。 例 如 ， 当 前 热 
度 极 高 的 ChatGPT 模 型 的 参数 量 高 达 1750 亿 ”， 据 受 
访 专家 估算 ， 如 采用 单 部 V100 型 号 的 GPU， 需 要 计 
算 约 355 年 。 为 加 速 计算 ， 需 要 的 投入 成 本 也 超 乎 想 
象 。 部 分 研究 者 坦言 ， 人 工 智 能 实验 室 的 组 建 需要 首 
席 研 究 员 购置 成 本 可 观 的 设备 ， 作 为 基础 设施 供 研究 
组 内 的 成 员 共 享 机 器 时 间 开 展 人 工 智能 研究 。 对 医院 
的 人 工 智 能 技术 潜在 研究 者 而 言 ， 获 取 与 研究 设想 相 


会 产生 噪声 ， 干 扰 信 号 的 提取 。 

(2) 储存 、 脱 敏 、 提 取 、 传 输 等 数据 处 理 相关 问 
题 。 人 工 智能 技术 能 够 将 更 加 接近 采集 端的 数据 直接 
纳入 模型 运算 ,信息 损失 更 小 。 然 而 ， 靠 近 采 和 集 端的 
数据 的 体 量 远 大 于 经 过 提取 后 的 结构 化 数据 ; 因此 ， 
调用 、 传 输 、 储 存 往往 都 依赖 医疗 机 构 。 然 而 ， 部 分 
接受 访谈 的 医院 管理 者 提 到 ， 对 数据 进行 提取 、 传 
输 、 备 份 等 操作 会 产生 可 观 的 成 本 ; 因此 ， 医 疗 机 构 
往往 不 愿 在 挖掘 数据 中 进行 更 多 的 投入 。 特 别 是 ， 数 
据 虽 然 储存 在 医院 ， 但 同时 也 属于 患者 个 人 ; 因此 ， 
还 必须 考虑 到 患者 隐私 、 伦 理 、 数 据 安 全 等 方面 。 这 
些 数据 处 理 相关 问题 是 将 临床 数据 转化 为 高 质量 研究 
数据 过 程 中 必须 解决 的 问题 。 

(3) 数据 标注 。 研 究 指出 ， 缺 乏 大 规模 高 质量 
标注 训练 数据 集 是 现 阶段 制约 我 国人 工 智 能 临床 应 
研究 发 展 的 关键 因素 9。 实际 上 ， 在 传统 的 数理 统 
计 方法 的 研究 中 ， 研 究 者 也 需要 花费 相当 多 的 工作 量 
识别 和 标记 图 像 关 键 点 。 这 与 人 工 智能 研究 中 ， 人 工 
标注 因 变 量 与 标记 图 像 关 键 点 的 工作 并 无 本 质 不 同 。 
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overviews/top-5-hospitals-using-machine-learning/. 


(4) OpenAL. Introducing ChatGPT. (2022-11-30)[2023-02-27]. https://openai.com/blog/chatgpt. 
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因此 ， 固 然 标注 数据 是 当前 人 工 智能 技术 应 用 中 需要 
关注 的 问题 ， 却 不 是 伴随 人 工 智 能 技术 而 新 出 现 的 问 
题 。 

3.4 人 工 智能 的 可 解释 性 较 弱 ， 使 临床 应 用 信心 不 足 

人 工 智能 的 可 解释 性 是 研究 者 高 度 关注 的 议题 ， 是 
人 工 智 能 研究 的 “皇冠 ”问题 "“"。 可 解释 性 难题 来 源 
于 机 器 学 习 算 法 自动 友 代 参数 的 设计 和 深度 神经 网 络 中 
巨大 的 参数 空间 的 结合 。 这 使 得 人 工 智能 被 认为 是 复杂 
的 “黑箱 ”模型 。 同 时 ， 人 工 智能 技术 天 然 地 带 有 迭代 
性 质 ， 即 从 输入 层 不 断 接近 和 到 达 输 出 层 的 过 程 ， 也 是 
从 旧 知 识 到 新 知识 的 过 程 。 既 往 的 求解 结果 可 能 是 一 个 
尚 不 能 被 科学 知识 及 理性 解释 的 结果 ， 而 这 种 不 可 解释 
性 ,会 自然 地 继承 到 新 生成 的 结果 之 中 。 

(1) 深度 神经 网 络 的 研究 结果 往往 由 一 系列 对 
模型 拟 合 能 力 的 指标 和 预测 能 力 构 成 ， 对 熟 答 传 统 数 
理 统计 的 医院 研究 者 而 言 ， 对 人 工 智 能 结果 进行 解释 
和 阐释 的 难度 较 大 。 在 经 典 的 数理 统计 中 ， 研 究 者 只 
需 关 注 统计 结果 表格 中 的 少数 关键 项 ， 即 可 完成 解 
释 。 例 如 ， 某 两 组 数据 的 均值 的 p 值 小 于 或 等 于 特定 
值 (如 0.05) ， 即 意味 着 存在 显著 的 统计 学 差异 ; A 
组 间 的 差 值 存在 临床 意义 ， 则 进一步 存在 应 用 意义 。 
由 于 几乎 所 有 医院 的 研究 者 已 几乎 无 条 件 地 信任 了 统 
计 学 家 和 软件 供应 商 提供 的 程序 ， 基 于 传统 统计 学 分 
析 的 方法 ， 同 行 认 可 度 更 高 。 与 之 构成 对 比 的 情境 
是 ， 当 医院 内 熟悉 人 工 智能 方法 的 研究 者 较 少 时 ， 研 
究 者 不 仅 需要 解释 人 工 智能 生成 的 研究 结果 ; 多 数 时 
候 ， 还 需要 对 人 工 智 能 方法 本 身 乃 至 技术 细节 进行 解 


释 。 


(2) 一 些 旨 在 解决 可 解释 性 挑战 的 可 视 化 算法 站 
的 技术 难度 很 高 。 医 院 研 究 者 及 团队 很 难 依靠 自身 力 
量 将 这 些 技能 内 部 化 。 研 究 者 即使 跨越 了 前 文 所 述 的 
学 习 关 、 成 本 关 ， 获 得 了 人 工 智能 的 研究 结果 ， 也 会 
遇 到 结果 解释 的 难题 ， 难 得 到 同行 的 充分 认可 。 掌 握 
团队 资源 、 确 定 团队 技术 路 线 的 团队 带头 人 ， 面 对 人 
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工 智能 可 解释 性 较 弱 的 特性 ， 将 很 难 下 决心 组 织 开展 
深层 次 研究 与 应 用 。 


4 从 政策 推动 到 研究 产 出 的 管理 建议 


4.1 抓 住 研究 范式 转变 机 遇 ，5 引 导 投入 研究 资源 

科学 的 发 展 存在 着 诸多 的 不 确定 性 ; 在 新 的 范式 
对 旧 的 范式 发 出 挑战 时 ， 更 有 可 能 产生 新 的 突破 性 发 
现 。 当 前 ， 人 工 智能 研究 范式 已 经 对 传统 的 数理 统计 
分 析 范 式 发 起 了 挑 成 ; 而 人 工 智能 方法 也 以 SVM 方法 
为 核心 ， 逐 渐 转 向 以 深度 神经 网 络 为 核心 的 新 方法 。 
虽然 人 工 智 能 面临 着 可 解释 的 挑战 ， 但 也 应 认识 到 ， 
没有 一 种 研究 方法 是 完美 的 。 只 有 面向 人 工 智能 研究 
投入 资源 才能 逐步 克服 和 优化 解释 问题 。 

国家 层面 ， 抓 住 研 究 范式 转换 的 历史 机 遇 ， 面 向 
人 工 智能 发 展 过 程 中 的 难点 和 痛 点 ， 在 新 旧 动 能 转换 
的 过 程 中 进一步 如 大 支持 力度 。 例 如 ， 可 以 通过 设置 
综合 医院 的 国家 人 工 智 能 医学 研究 中 心 ， 设 置 互 联网 
医院 、 智 慧 医院 等 样板 医院 ， 以 及 面向 人 民生 命 健康 
的 人 工 智 能 相关 “ 揭 榜 挂帅 ”攻关 课题 等 方式 ， 培 育 
公立 医院 在 发 展 人 工 智 能 中 的 良好 的 竞争 文化 ， 同 向 
RII, 实现 “ 弯 道 超车 ”的 政策 推动 目标 。 

医院 层面 ， 优 化 人 工 智 能 研究 领域 的 资源 投入 。 
通过 开设 人 工 智 能 课堂 、 组 建 院 级 人 工 智能 计算 共享 
平台 ， 设 置 专门 铸 育 项 目 等 方式 ， 加 大 对 支持 力度 ， 
鼓励 以 人 工 智 能 方法 为 核心 或 将 人 工 智能 方法 与 传统 
统计 方法 相 结合 的 研究 。 通 过 营造 良好 的 人 工 智能 研 
究 文 化 ， 审 慎 组 织 ， 面 向 人 工 吞 能 的 技术 性 挑战 ， 监 
越 人 工 智 能 技术 性 障碍 。 
4.2 面向 人 工 智 能 技术 ， 布 局 多 模 态 数据 资源 

推动 人 工 智 能 研究 走向 深入 ， 医 院 还 应 主动 布局 
多 模 态 数据 资源 结构 。 医 院 可 采取 更 加 开放 的 态度 ， 
允许 研究 项 目 获 得 小 规模 的 患者 数据 作为 数据 集 。 创 
新 条 件 较 好 的 医院 可 搭建 人 工 智能 数据 平台 ， 人 允许 经 
研究 团队 标注 的 小 规模 样本 集 对 院内 研究 者 开放 ， 供 
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研究 者 熟悉 和 优化 改进 数据 集 。 对 一 些 基 于 院内 公开 


` x PRH 5 结语 
的 小 样本 集 已 经 取得 成 果 的 项 目 ， 设 置 快 速 扩容 数据 
量 及 伦理 等 相关 工作 审批 流程 ， 加 速 且 化 人 工 智 能 研 本 研究 聚焦 医院 主导 人 工 智 能 研究 ， 总 结 和 分 析 
究 。 了 医院 研究 者 在 尝试 学 习 和 应 用 人 工 智能 技术 时 需要 


医院 内 的 研究 团队 可 根据 研究 资源 主动 参与 多 模 ”跨越 的 技术 性 难题 ， 可 为 医疗 机 构 和 管理 部 门 制定 政 
态 数据 布局 。 资 源 较 丰 富 的 医院 研究 者 团队 可 尝试 使 — 策 和 实施 管理 提供 参考 。 医 院 主 导 人 工 智 能 研究 的 技 
用 无 监督 学 习 聚 类 等 机 器 学 习 算法 ， 从 多 个 维度 对 数 。” ” 术 性 难题 在 于 ， 人 工 智 能 技术 学 习 曲 线 陡峭 、 适 代 成 
据 进 行 描述 与 归 类 ， 提 前 对 数据 进行 小 规模 尝试 性 标 — 本 高 、 高 质量 多 模 态 研究 数据 难得 和 人 工 智能 可 解 
记 ， 建 立 研究 者 及 研究 团队 专属 的 多 模 态 数据 的 小 样 。 释 较 弱 。 考 虑 到 人 工 智 能 技术 有 望 加 速 信 息 提取 与 运 
本 库 。 掌 握 研究 资源 不 丰富 的 研究 者 可 在 使 用 传统 统 ” 算 过 程 ， 扩 展 纳入 研究 的 数据 模 态 ， 产 出 有 深度 的 、 
计 方 法 进行 病例 研究 的 同时 ， 留 意 收 集 该 病例 的 多 模 。 具有 临床 应 用 意义 的 研究 成 果 ， 医 疗 机 构 应 当主 动 响 


态 数据 ， 逐 步 尝试 纳入 多 模 态 数据 并 应 用 人 工 智能 方 。 应 政策 推动 ， 调 动 内 部 资源 ， 主 导 人 工 智能 技术 内 部 

法 拓展 研究 。 化 。 未来， 可 通过 增 养 人 工 智能 协调 员 ， 培 育 人 工 知 

43 培养 人 工 智能 协调 员 ， 推 动人 工 智能 研究 走向 。 ÜÉPORACT. EDDA EREDOROUR E SUSECRSE 
深入 源 ， 促 进 研究 产 出 。 


医院 可 采取 培养 人 工 智能 协调 员 的 方法 ， 进 一 步 
推动 人 工 智能 临床 应 用 研究 走向 深入 。 人 研究 指出 ， 医 参考 文献 
院 应 采取 多 学 科 合作 模式 "" 发 展 人 工 智能 的 路 径 。 张 梦 国 , 人 工 智能 + 智慧 医 院 现状 与 发 展 趋势 研究 中 国 中 
实 上 ， 部 分 高 质量 发 展 试点 医院 也 已 启动 了 高 校 、 科 SR 
研 院 所 和 医疗 机 构 之 间 的 合作 。 但 无 论 是 研究 建议 还 Zhang M Y. Research on the present situation and development 
是 实践 ， 均 未 聚焦 担任 团队 间 “ 桥 粱 ”的 院内 工作 角 
色 。 美 国医 院 协会 的 报告 指出 ， 人 工 智 能 的 发 展 可 
促使 医院 设置 包括 人 工 智 能 工程 师 、 首 席 人 工 智能 
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From Policy Promotion to Research Output: Brief Analysis of 


Technical Challenges of Hospital-led Artificial Intelligence Research 


ZHUANG Yu" ZHOU Cheng 
(1 Department of Philosophy, Peking University, Beijing 100871, China; 
2 Peking University Third Hospital, Beijing 100191, China; 
3 School of Health Humanities, Peking University, Beijing 100191, China ) 


Abstract In recent years, artificial intelligence has become a key direction of medical and health-related research and a hot spot of 


international competition. In order to investigate the current situation and challenges in hospital-led artificial intelligence researched, this study 


selects 14 national pilot hospitals to promote the high-quality development of public hospitals as samples, adopts a combination of quantitative 


and qualitative methods, analyzes the research articles related to artificial intelligence published by the sample hospitals in recent years, and 


analyzes the technical challenges in the hospital-led artificial intelligence research. The results show that although the number of hospital-led 


artificial intelligence research papers is increasing, in which 559^ of the research is of prospect and expectation, while the quality of research 
g pap g prosp p q 


could be improved. Meanwhile, the number of authorized AI related patent is rather small. The technical difficulties of hospital-led artificial 


intelligence research lie in the steep learning curve of artificial intelligence technology, high costs from computation iteration, difficulties 


in transferring clinical multimodal data into research data, and weak explainability. Hospitals should actively respond to policy promotion, 


reallocating resources to cultivate artificial intelligence coordinators, organize multi-modal data resources, and promote research and outputs. 


Keywords artificial intelligence, hospital leading, multi-modal data, research coordinator 
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